Аветисов М.А.
align=center>СОВРЕМЕННАЯ ПОИСКОВАЯ СИСТЕМА "АРТЕФАКТ" И БИБЛИОТЕКА
Центральная научная сельскохозяйственная библиотека является основным библиотечным и информационным органом аграрно-промышлен-ного комплекса (АПК) России. Пользователями библиотеки являются ученые и специалисты Российской академии сельскохозяйственных наук (РАСХН), ведущие исследования в области сельского хозяйства, профессорско-преподавательский состав, студенты высших учебных заведений аграрно-промышленного комплекса, другие пользователи, интересующиеся вопросами сельского хозяйства и пищевой индустрии.
Бурное развитие коммуникаций,
сети Интернет в России требует от крупных библиотек активного участия в
представлении своих ресурсов по каналам глобальных сетей. При этом следует
обеспечить простой поиск нужной информации, возможность работы с электронными
изданиями, полнотекстовыми документами, электронную доставку необходимых
для пользователей материалов.
Исходя из этих положений, ЦНСХБ развивает свою автоматизированную систему.
Она базируется на двух операционных средах UNIX (AIX) и Windows NT. В
качестве поисковой системы используется информационно-поисковая система
(ИПС) "Артефакт", разработанная информационным агентством "Интегрум-техно".
ИПС "Артефакт" обладает уникальными характеристиками и предназначена для обработки, в первую очередь, документов, написанных на русском языке. Качество используемых лингвистических технологий и алгоритмов подтверждается огромным суммарным объемом баз данных, предоставляемых агентством в этой ИПС (до 50 Гб информации). ИПС работает под управлением Windows NT. Скорость поиска чрезвычайно высока, практически нет ограничений на объем баз, их количество, число полей для поиска, размер документа. Для пользователей, которые не имеют кириллических шрифтов, имеется возможность работать с транслитерированным текстом и запросами.
Интерфейс пользователя прост, может быть несколько нетрадиционен для библиотечных ИПС. Мощный и удобный язык запросов к информации является ключевой характеристикой ИПС. Артефакт позволяет учесть в запросе любые факты, связанные с естественной структурой текста (разделение на слова, предложения, поля, взаимное расположение слов и расстояние между ними), и предоставляет пользователю все необходимые логические операторы для формирования запроса (И, ИЛИ, НЕ, скобки, контекстные операторы). Используются алгоритмы морфологического анализа, что практически избавляет от необходимости учитывать механизм усечения (который тоже реализован в системе левый правый и двусторонний) и знания форм слова для корректного составления запроса.
Для чисел и дат, встречающихся в документах базы, предусмотрена специальная обработка. ИПС проводит распознавание дат, заданных в различных форматах, и реализует как числовой поиск, так и поиск по диапазону дат, заданному в запросе.
Простые элементы запроса могут произвольным образом группироваться с помощью механизма приоритетов и скобок, составляя запросы практически любой сложности. Таким образом, в ИПС "Артефакт" реализован полный (и даже в некотором смысле изощренный) язык запросов.
Библиотека создала свой узел в Интернет и выставила базу данных объемом более 800 тыс. документов. Ее еженедельное пополнение до 5000 документов. База включает библиографические описания книг, сборников, статей из журналов и сборников, сопровождаемые краткими аннотациями, рефератами (15% статей), терминами тезауруса, рубриками рубрикатора по сельскому хозяйству и т.п.
Используемая ИПС предназначена для работы с полнотекстовыми базами данных. Проводимые в настоящее время работы по созданию новой версии ИПС дадут возможность обеспечить поиск в документах, созданных на языке HTML. В настоящее время ЦНСХБ приступила к работе по проекту "Аграрная сельскохозяйственная библиотека", реализация которого позволит предоставить пользователям:
а) отчеты по завершенным научно-техническим разработкам (НТР) и ведомственные материалы Министерства сельского хозяйства и продовольствия (МСХП) РФ и РАСХН (полные тексты);
б) рефераты отчетов завершенных НТР;
в) паспорта НТР;
г) библиографические описания документов;
д) справочно-адресную информацию по научно-исследовательским институтам (НИИ) АПК и их продукции.
Полнотекстовые документы, загружаемые в информационную базу, являются слабоструктурированными документами в формате HTML, сопровождаются графиками, рисунками и схемами. При формировании описаний документов учитываются рекомендации российской версии формата UNIMARC.